home *** CD-ROM | disk | FTP | other *** search
/ Monster Media 1994 #2 / Monster Media No. 2 (Monster Media)(1994).ISO / utils1 / csp61.zip / CORSPEED.TXT < prev    next >
Text File  |  1994-05-30  |  58KB  |  1,436 lines

  1.                             SOFWIN LABORATORIES
  2.                          Super Scalar Technologies
  3.  
  4.  
  5.                                  CORSPEED
  6.                                 version 6.1
  7.  
  8.                     PC COMPUTING SPEED MEASUREMENT TOOL
  9.  
  10.                             Sofwin Laboratories
  11.                              613 Old Farm Road
  12.                            Columbus, Ohio 43213
  13.  
  14.      Telephone:  (614) 866-9966                BBS/FAX  (614) 866-9960
  15.                            CompuServe 74431,1071
  16.  
  17.                 This file updated through:  May 29, 1994
  18.                     Copyright 1994 Sofwin Laboratories
  19.  
  20. ============================================================================
  21.  
  22.                                 DESCRIPTION
  23.  
  24. This high technology computer performance measurement tool is part of Sofwin
  25. Laboratories' new SuperScalar technology package.  This is a full scale tool
  26. suitable for professional, engineering, and personal use in the assessment of
  27. PC Core Engine ( CPU <-> Memory ) performance.
  28.  
  29.     SHAREWARE REGISTRATION $29
  30.  
  31. While CORSPEED is being offered as shareware, it is neither free nor a toy.
  32. This  is a fully functional, professional grade measurement tool.  If you
  33. want to use this  tool for more than 90 days, want to receive full
  34. professional documentation, or want to be included in Sofwin's Update
  35. Notification Program you need to register  this software.  Registration of
  36. this shareware version is only $29.  Send your  check in the amount of $29 to
  37. CORSPEED Registration, Sofwin Laboratories,  613 Old Farm Road, Columbus,
  38. Ohio 43213, or call (800) 339-2579 to use your  credit card.
  39.  
  40.     PROFESSIONAL VERSION WITH FULL SOFWIN DOCUMENTATION $39
  41.  
  42. If you'd prefer to have the full professional ( serialized ) version of
  43. CORSPEED delivered to your door on 1.44 MB 3.5 floppy disk including both
  44. printable and browsable documentation for all current Sofwin measurement
  45. tools, the price is only $39.  Ask for PROFESSIONAL CORSPEED PACKAGE.
  46.  
  47.         PRINTING INFORMATION
  48.  
  49. This document has been prepared with form feeds embedded for easy printing on
  50. any standard printer.  Including the header and footer, there are 55 lines
  51. per page.  A simple DOS command may be used to print this file.
  52.  
  53.         C:>COPY CSP.DOC PRN
  54.  
  55.        CORSPEED DOCUMENTATION                                     Page 1
  56.  
  57.        Sofwin Laboratories                 SuperScalar Measurement Tools
  58.  
  59.  
  60.                             TABLE OF CONTENTS
  61.  
  62. SECTION I -- OVERVIEW. . . . . . . . . . . . . . . . . . . . . . . . . . .4
  63.  
  64.      TECHNOLOGY  . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4
  65.      WHAT CORSPEED DOES. . . . . . . . . . . . . . . . . . . . . . . . . .5
  66.      HOW CORSPEED IS DIFFERENT . . . . . . . . . . . . . . . . . . . . . .5
  67.      PROCESSORS SUPPORTED. . . . . . . . . . . . . . . . . . . . . . . . .7
  68.      PROCESSOR FAMILY EXPANSION. . . . . . . . . . . . . . . . . . . . . .7
  69.  
  70. SECTION II -- OPERATING INFORMATION. . . . . . . . . . . . . . . . . . . .8
  71.      COMMAND LINE OPTIONS. . . . . . . . . . . . . . . . . . . . . . . . .8
  72.      KEYBOARD ASSIGNMENTS. . . . . . . . . . . . . . . . . . . . . . . . .9
  73.           FUNCTION KEYS. . . . . . . . . . . . . . . . . . . . . . . . . .9
  74.      SYSTEM CONFIGURATION. . . . . . . . . . . . . . . . . . . . . . . . .9
  75.      PROCESSOR INFORMATION . . . . . . . . . . . . . . . . . . . . . . . .9
  76.      MEMORY CONFIGURATION. . . . . . . . . . . . . . . . . . . . . . . . 10
  77.      SYSTEM INFORMATION. . . . . . . . . . . . . . . . . . . . . . . . . 10
  78.      FOR BEST RESULTS. . . . . . . . . . . . . . . . . . . . . . . . . . 10
  79.      LOW SPEED LIMITATIONS . . . . . . . . . . . . . . . . . . . . . . . 10
  80.      EFFECTIVE RUNNING SPEEDS. . . . . . . . . . . . . . . . . . . . . . 11
  81.      MEMORY WINDOWS. . . . . . . . . . . . . . . . . . . . . . . . . . . 11
  82.      UNDERSTANDING EFFECTIVE DATA WIDTH. . . . . . . . . . . . . . . . . 12
  83.      HIGH PERFORMANCE MEMORY SYSTEMS . . . . . . . . . . . . . . . . . . 12
  84.      HOW CORSPEED DIFFERS FROM BENCHMARKS. . . . . . . . . . . . . . . . 13
  85.      HOW TO ESTIMATE HOW FAST MULTIPLE TASKS WILL RUN. . . . . . . . . . 13
  86.      CORE ENGINE PERFORMANCE IS NOT THE WHOLE STORY. . . . . . . . . . . 14
  87.      THE IMPORTANCE OF SUPERSCALAR TECHNOLOGY. . . . . . . . . . . . . . 14
  88.      SOFWIN FORUM MESSAGE SUPPORT. . . . . . . . . . . . . . . . . . . . 15
  89.      FILE NAMES. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
  90.      RECORDING . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
  91.           USING THE SOFWIN COMMENTS EDITOR . . . . . . . . . . . . . . . 15
  92.           KEYBOARD . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
  93.      PRINTER OUTPUT. . . . . . . . . . . . . . . . . . . . . . . . . . . 16
  94.  
  95. SECTION III -- HOW VERSION 6.1 DIFFERS FROM 6.0x releases. . . . . . . . 17
  96.      CHANGES TO EXISTING FEATURES. . . . . . . . . . . . . . . . . . . . 17
  97.      NEW FEATURES. . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
  98.           EFFECTIVE READ-WRITE DATA WIDTH DISPLAY. . . . . . . . . . . . 17
  99.           UNDERSTANDING EFFECTIVE DATA WIDTH . . . . . . . . . . . . . . 17
  100.                HISTOGRAM COLOR SCHEME. . . . . . . . . . . . . . . . . . 18
  101.      SOFWIN FORUM MESSAGE SUPPORT. . . . . . . . . . . . . . . . . . . . 18
  102.           FORUM RECORDING PROCEDURES . . . . . . . . . . . . . . . . . . 18
  103.           RECORDING. . . . . . . . . . . . . . . . . . . . . . . . . . . 18
  104.           COMMENT MANAGEMENT . . . . . . . . . . . . . . . . . . . . . . 19
  105.      SAMPLE FORUM RECORDING. . . . . . . . . . . . . . . . . . . . . . . 19
  106.      HOW TO COPY CORSPEED RECORDING TO A FORUM MESSAGE . . . . . . . . . 20
  107.           USING COMPUSERVE'S WINCIM. . . . . . . . . . . . . . . . . . . 20
  108.           USING A FORUM NAVIGATOR  . . . . . . . . . . . . . . . . . . . 20
  109.  
  110.  
  111.        CORSPEED DOCUMENTATION                                     Page 2
  112.  
  113.        Sofwin Laboratories                 SuperScalar Measurement Tools
  114.  
  115.  
  116. SECTION IV -- OPERATING PRINCIPLES . . . . . . . . . . . . . . . . . . . 21
  117.      MEMORY CONFIGURATION. . . . . . . . . . . . . . . . . . . . . . . . 21
  118.      SYSTEM INFORMATION. . . . . . . . . . . . . . . . . . . . . . . . . 21
  119.      HIGH PERFORMANCE MEMORY SYSTEMS . . . . . . . . . . . . . . . . . . 22
  120.      HOW TO ESTIMATE HOW FAST MULTIPLE TASKS WILL RUN  . . . . . . . . . 22
  121.      CORE ENGINE PERFORMANCE IS NOT THE WHOLE STORY. . . . . . . . . . . 23
  122.      THE IMPORTANCE OF SUPERSCALAR TECHNOLOGY. . . . . . . . . . . . . . 23
  123.      PROCESSOR FAMILIES. . . . . . . . . . . . . . . . . . . . . . . . . 24
  124.  
  125. SECTION V -- ABOUT SOFWIN LABORATORIES . . . . . . . . . . . . . . . . . 25
  126.      WANT TO KNOW MORE?. . . . . . . . . . . . . . . . . . . . . . . . . 25
  127.           SOFWIN REPORTS . . . . . . . . . . . . . . . . . . . . . . . . 25
  128.           TOOL CATALOG . . . . . . . . . . . . . . . . . . . . . . . . . 25
  129.  
  130. SECTION VI -- SHAREWARE REGISTRATION . . . . . . . . . . . . . . . . . . 26
  131.  
  132.  
  133.  
  134.  
  135.  
  136.  
  137.  
  138.  
  139.  
  140.  
  141.  
  142.  
  143.  
  144.  
  145.  
  146.  
  147.  
  148.  
  149.  
  150.  
  151.  
  152.  
  153.  
  154.  
  155.  
  156.  
  157.  
  158.  
  159.  
  160.  
  161.  
  162.  
  163.  
  164.  
  165.  
  166.        CORSPEED DOCUMENTATION                                     Page 3
  167.  
  168.        Sofwin Laboratories                 SuperScalar Measurement Tools
  169.  
  170.  
  171.                            SECTION I -- OVERVIEW
  172.  
  173. This high technology computer performance measurement tool is part of Sofwin
  174. Laboratories' new SuperScalar technology package.  This is a full scale tool
  175. suitable for professional, engineering, and personal use in the assessment of
  176. PC Core Engine ( CPU <-> Memory ) performance.
  177.  
  178.  
  179. TECHNOLOGY
  180.  
  181. Recent advances in the computer industry which are applicable to processor
  182. and/or memory system technology are increasingly incompatible with prior art
  183. in this field.  While the future of PC technology, as it combines with and
  184. merges with video, mini-computer technology, distributed processing, and high
  185. powered engineering workstations, lies in diverse processor and memory
  186. technologies ( such as the DEC Alpha, MIPS 6000, Cyrix M5, NexGen 586 and
  187. other processors ).  There is no backwards compatibility from Intel's x86
  188. architecture, for example, to Digital new Alpha processor -- or for that
  189. matter to the PowerPC, or MIPS RISC processors.  New technology is required
  190. which is not only capable of assessing hardware performance on the new
  191. processor families, but more importantly which can make direct comparisons
  192. between systems possible.
  193.  
  194. Where single thread, inline, segmented, real memory operations were once the
  195. only game in town in the PC business, the introduction of new processor
  196. technologies, including Intel's PENTIUM goes beyond the pipelined abilities
  197. of the 486 series processors.  The new processor families are not all x86
  198. compatible.  While most of the new processors, including Intel's Pentium are
  199. fully x86 compatible in one operating mode, many provide one or more
  200. additional modes which may be not x86 compatible.  The Pentium, for example,
  201. can make better use of its superscalar capabilities when running recompiled
  202. code that is optimized for dual pipeline execution.
  203.  
  204. So, while the native operating mode of Cyrix' new M5 is x86 based, other
  205. processor families such as the PowerPC run x86 instructions in compatibility
  206. modes which are not indemic to the x86 instruction set.  Tools which are to
  207. work across multiple processor families and operating system environments
  208. must meet stringent operating requirements that assure compatibility and
  209. consistency from one processor family to another.
  210.  
  211. As part of Sofwin Laboratories completely new SuperScalar technology,
  212. CORSPEED is at once a continuation of the past as well as a major shift in
  213. direction to focus on the future.  Superscaler, multi pipelined instruction
  214. execution is a new ballgame and CORSPEED is designed, wherever there is any
  215. conflict, to adhere to the emerging standards.
  216.  
  217.  
  218.  
  219.  
  220.  
  221.        CORSPEED DOCUMENTATION                                     Page 4
  222.  
  223.        Sofwin Laboratories                 SuperScalar Measurement Tools
  224.  
  225.  
  226. WHAT CORSPEED DOES
  227.  
  228. The performance of variable logic memory systems ( cached memory )
  229. degrades as the magnitude of active memory addresses is increased.
  230. Variable logic memory performance drops off as the active address area
  231. increases due to the increasing need for lower memory information to be
  232. located and copied into higher levels of cache.  While some PC systems are
  233. efficient, capable of uploading a cache line in as little as 6 clock
  234. cycles at 33 MHz, other designs may require as many as 46 clock cycles to
  235. upload one 16 byte line of data or instructions.  Since the processor is
  236. halted while cache housekeeping is underway, the system that can upload
  237. memory into the cache in 6 cycles is going to appear to be running faster
  238. than one that takes 46 clocks to do the same work.
  239.  
  240. CORSPEED makes comparing PC system performance straightforward and easy by
  241. computing the EFFECTIVE RUNNING speed you can expect in any of four major
  242. operating system environments.  Since memory footprint ( the extent of
  243. active memory area required by an application ) size, the number of
  244. running tasks, and even the memory dispersion characteristics of the
  245. operating system directly impact memory - cache management, it's useful to
  246. know how applications of different sizes will be impacted by the core
  247. engine performance curves.
  248.  
  249. The fundamental principle behind CORSPEED is Effective Running Speed.  A
  250. 50 MHz 486 that never has a cache miss ( hence no cache updating or
  251. housekeeping ) runs your applications at its full 50 MHz speed.  But when
  252. cache misses increase things can start to slow down very quickly.  For
  253. example a 50 MHz 486 that is stopped 50% of the time for cache system
  254. housekeeping may be running at 50 MHz while it is running, but since it is
  255. stopped half the time, its effective running speed is only 25 MHz.
  256.  
  257.  
  258. HOW CORSPEED IS DIFFERENT
  259.  
  260. CORSPEED is vastly different in technology, architecture, operation and
  261. appearance than prior Sofwin measurement tools.  Here's how:
  262.  
  263. 1) Sofwin's new SuperScalar, parallel processing technology can measure and
  264.    evaluate single, dual and quad pipelines in a single processor.  This
  265.    development was required for Pentium ( dual pipeline capability )
  266.    qualification as well as to permit forward technology development to
  267.    radically different processors such as the DEC Alpha, MIPS 6000, Cyrix M5
  268.    series, and others.  CORSPEED directly monitors the performance impact the
  269.    Pentium's U and the V pipes, where the U pipe can execute all
  270.    instructions, and the V pipe is limited to simple integer and floating
  271.    point instructions.  CORSPEED is required to recognize  conflicts between
  272.    these two unequal channels, so new in-line assembly code was required to
  273.    assure control of which pipe is executing and whether the V pipe is held
  274.    off due to sequencing conflict(s).
  275.  
  276.     CORSPEED DOCUMENTATION                                     Page 5
  277.  
  278.        Sofwin Laboratories                 SuperScalar Measurement Tools
  279.  
  280.  
  281.    Sofwin's SP/ESP technology can measure, track and analyze processor
  282.    operations which are pipelined and simultaneously executed by the
  283.    processor, regardless of whether they are in-sequence or out-sequence at
  284.    time of execution.  Where required, SP/ESP modifies the binary instruction
  285.    set to measure operations as fully Pentium optimized.
  286.  
  287.    SP/ESP measurement technology is backwards compatible with prior versions
  288.    of the x86 instruction set only to the 486 series.  Support for all prior
  289.    versions of the x86 architecture is incompatible with  SP/ESP and
  290.    measurement of those systems has been abandoned in this product.
  291.  
  292.    SP/ESP has also been modified to properly handle simultaneous floating
  293.    point operations, whether in parallel with integer operations, or in
  294.    parallel with compatible floating point operations.  While simultaneous
  295.    executions may require recompilation of applications code, CORSPEED is
  296.    now fully qualified for multiple simultaneous operations/measurements.
  297.    This implies that CORSPEED's integer and floating point measurements
  298.    represent the execution timing of fully qualified PENTIUM binaries.
  299.  
  300.    Standard, integer and floating point code, ( not PENTIUM optimized ) will
  301.    execute slower, but the exact degree to which it executes slower is
  302.    determined by the random placement of compatible and incompatible opcodes
  303.    in the data stream.  CORSPEED cannot predict random, unqualified opcode
  304.    performance levels, so keep in mind, that when measuring PENTIUM based
  305.    systems, the performance indicators are for PENTIUM optimized binaries.
  306.  
  307. 2) SP/ESP is configured for multiple cache facilities, where the number of
  308.    parallel caching systems may be 1, 2, or 4.  The Pentium uses only the
  309.    dual cache facility with its parallel 8 kb data and 8 kb opcode cache
  310.    units.  Cache line sizes have been widened for 16 bits in prior versions
  311.    of CORSPEED to 64 bits in this version.  Cache line size limits have been
  312.    increased from 16 bytes in prior versions to 128 bytes in this version.
  313.  
  314. 3) State machine level analysis confirms that the resulting opcode stream
  315.    generated by CORSPEED fully complies with Intel's Branch Prediction rules
  316.    so that no branch events ( in the primitive routines ) are unaccounted for
  317.    at runtime.
  318.  
  319.  
  320.  
  321.  
  322.  
  323.  
  324.  
  325.  
  326.  
  327.  
  328.  
  329.  
  330.  
  331.        CORSPEED DOCUMENTATION                                     Page 6
  332.  
  333.        Sofwin Laboratories                 SuperScalar Measurement Tools
  334.  
  335.  
  336. PROCESSORS SUPPORTED IN THIS VERSION
  337.  
  338. INTEL          486sx, 486dx, 486dx2, Intel4DX, Pentium, 486SL, etc.
  339.  
  340. IBM            486sx, 486dx, 486dx2, 486dx3, etc.
  341.  
  342. AMD            486sx, 486dx, 486dx2, etc
  343.  
  344. Cyrix          Cx486SLC, Cx486DLC, Cx486SL2, Cx486DL2, Cx486SR,
  345.                Cx486DR, Cx486SR2, Cx486DR2, Cx486S, Cx486S2,
  346.                Cx486SE, Cx486S2E, Cx486DX, Cx486DX2, CxM1
  347.  
  348.  
  349.  
  350. PROCESSOR FAMILY EXPANSION
  351.  
  352. As demand warrants, Sofwin tool processor support will be expanded to new
  353. processor families.  Here are the processor families currently being
  354. considered for support:
  355.  
  356. NexGen         586 series
  357.  
  358. PowerPC        601, 602, 620
  359.  
  360. Digital Equip  Alpha series
  361.  
  362. MIPS           6000 series
  363.  
  364.  
  365.  
  366.  
  367.  
  368.  
  369.  
  370.  
  371.  
  372.  
  373.  
  374.  
  375.  
  376.  
  377.  
  378.  
  379.  
  380.  
  381.  
  382.  
  383.  
  384.  
  385.  
  386.        CORSPEED DOCUMENTATION                                     Page 7
  387.  
  388.        Sofwin Laboratories                 SuperScalar Measurement Tools
  389.  
  390.  
  391.                     SECTION II -- OPERATING INFORMATION
  392.  
  393. CORSPEED is a high performance performance assessment tool.  As a result,
  394. CORSPEED MAY NOT OPERATE PROPERLY ON LOW PERFORMANCE PC SYSTEMS.
  395.  
  396. In general, use of this tool should be restricted to High Performance PC
  397. systems running at 33 Mhz and higher that are equipped with floating point
  398. processors.  Equipment who's performance falls below the design operating
  399. envelope or which is not equipped with a high speed floating point
  400. coprocessor facility may cause unexpected program termination.
  401.  
  402.  
  403.  
  404. COMMAND LINE OPTIONS
  405.  
  406.    CORSPEED [ opt1 ] [ optn ] < ENTER >
  407.  
  408.       Where:
  409.  
  410.       -b        Forces the automatic color display into black and white mode.
  411.  
  412.       -c xxx    Specifies L2 cache size from 32 kb to real memory limit
  413.                 [ in kb ]. Use this option if the L2 cache is larger than
  414.                 256 kb.
  415.  
  416.       -e        Use this option if high performance memory such as EDRAM is
  417.                 installed, or if you want to simulate how it would affect
  418.                 system performance.
  419.  
  420.       -t xx     Use this option if you want the results scaled to a per task
  421.                 basis.
  422.  
  423.       -m xxxx   Use this option if main memory is larger than 64 mbytes.
  424.  
  425.       -s        Enables the optional sound effects system.
  426.  
  427.       -o        Disables odometer display feature.
  428.  
  429.       -h        Invokes this help display directly from the command line.
  430.  
  431.       -$ xx.xx  Use this to input cost for cost/performance computation.
  432.  
  433.  
  434.  
  435.  
  436.  
  437.  
  438.  
  439.  
  440.  
  441.        CORSPEED DOCUMENTATION                                     Page 8
  442.  
  443.        Sofwin Laboratories                 SuperScalar Measurement Tools
  444.  
  445.  
  446. KEYBOARD ASSIGNMENTS
  447.  
  448.    FUNCTION KEYS
  449.  
  450.            F1  invokes HELP system.
  451.  
  452.    SHIFT + F1  Displays serial number and licensee information
  453.  
  454.            F3  Records measurement data in Sofwin Forum format
  455.  
  456.            F4  Create or Edit Forum record comments
  457.  
  458.            F7  Prints screen image to LPT1.
  459.  
  460.            F8  Appends screen image to CORSPEED.SCR file.
  461.  
  462.            ESC Quit CORSPEED and return to DOS.
  463.  
  464.      ALT + S   Toggle the SOUND and VIDEO EFFECTS on/off.
  465.  
  466.      ALT + X   Unconditional return to DOS.
  467.  
  468.  
  469. SYSTEM CONFIGURATION
  470.  
  471. The boxed area at the top of the screen is filled in by CORSPEED during
  472. hardware and software analysis operations.  The three system configuration
  473. areas which are critical to proper operation of CORSPEED are Processor,
  474. Memory, and operating system.
  475.  
  476.  
  477. PROCESSOR INFORMATION
  478.  
  479. Processor type and extension give you important information about potential
  480. computing capacity.  While CORSPEED will show about the same level of Core
  481. Engine performance for either SX or DX class processors, DX processors are
  482. required for optimum floating point performance in graphics, drawing, and
  483. spreadsheet applications.  Use the CLOCK information to confirm that the PC
  484. is operating at the proper speed.  While CORSPEED will operate in all proces-
  485. sor modes, REAL mode generally provides the most accurate measurements.
  486.  
  487. If the processor is doubly or triply clocked, a number may appear at the end
  488. of the processor type.  A '2' means double clocking, etc.
  489.  
  490.  
  491.  
  492.  
  493.  
  494.  
  495.  
  496.        CORSPEED DOCUMENTATION                                     Page 9
  497.  
  498.        Sofwin Laboratories                 SuperScalar Measurement Tools
  499.  
  500.  
  501. MEMORY CONFIGURATION
  502.  
  503. The memory cache levels used in 486 based PCs are numbered L1 and L2,
  504. according to their proximity to the processor.  The on-chip cache is called
  505. L1, while a secondary cache [ logically residing between the processor and
  506. main memory ] is called L2.
  507.  
  508. CORSPEED measures and analyzes the organization of each cache level and its
  509. size is displayed in kilobytes.  Cache size, speed, and organization are
  510. instrumental in determining program operating speeds.  In general, memory
  511. caching systems provide the biggest benefit when program code and data are
  512. frequently accessed from the cache.  That's because the CPU must wait
  513. whenever new data is uploaded from main memory -- thereby yielding some of
  514. its speed advantage.  In general, the more the software's memory address span
  515. exceeds cache size, the less effective the cache.
  516.  
  517. For complex, multi-tasking operating systems, or very large memory spans,
  518. cache miss penalties can effectively cancel some or all of the benefits of
  519. cache memory.
  520.  
  521. SYSTEM INFORMATION
  522.  
  523. Accurate performance measurement requires that there be nothing else going on
  524. that might interfere with the measurement routines in CORSPEED.
  525.  
  526. CORSPEED derives its information by directly manipulating all of the
  527. principal hardware systems.  To do its job, CORSPEED must be operated at the
  528. equivalent of Intel's PL-0.  While operating at the O/S kernel level, and
  529. actively interleaving with and preempting DOS interrupts, it is possible for
  530. the measurement primitives to accurately measure hardware operations at the
  531. electrical event level.
  532.  
  533. FOR BEST RESULTS USE THIS TOOL ONLY ON DOS BASED Pcs
  534.  
  535. CORSPEED is certified to operate with standard MSDOS, versions 3.1 and up.
  536. Measurement activity will be adversely impacted in any operating environment
  537. that preempts PL-0, loads CORSPEED at an unpredictable address, or interferes
  538. with interrupt management.  This means that CORSPEED will not provide satis-
  539. factory results under other operating systems including Windows [any version]
  540. or OS/2.
  541.  
  542. LOW SPEED LIMITATIONS
  543.  
  544. CORSPEED MAY NOT OPERATE PROPERLY ON LOW PERFORMANCE PC SYSTEMS.  In general,
  545. use of this tool should be restricted to High Performance PC systems running
  546. at 33 Mhz and higher that are equipped with floating point processors.
  547. Equipment who's performance falls below the design operating envelope or
  548. which is not equipped with a high speed floating point coprocessor facility
  549. may cause unexpected program termination.
  550.  
  551.        CORSPEED DOCUMENTATION                                     Page 10
  552.  
  553.        Sofwin Laboratories                 SuperScalar Measurement Tools
  554.  
  555.  
  556. EFFECTIVE RUNNING SPEEDS
  557.  
  558. Your CPU runs at its advertised clocking rate except when it is stopped to
  559. wait for cache system updates, line fills, or main memory operations.  The
  560. percentage of time the processor is stopped directly impacts how fast any
  561. application can execute.  For example, a 50 MHz 486 processor stopped 50% of
  562. the time by memory system delays will execute a program at about the same
  563. speed as a 25 MHz 486 which never has to wait for memory or cache updates.
  564. The more often, and longer, a cpu has to wait, the lower its Effective
  565. Running Speed.  As cache size is decreased, or program memory requirements
  566. increase, the percentage of time the cpu is stopped increases. Effective
  567. Running Speeds are easy to understand.  When comparing two systems,the one
  568. with the higher number will execute programs proportionately faster.
  569.  
  570. Since the complexity of the application and operating system play a
  571. deterministic role in how computing resources are utilized, software which
  572. makes lesser demands on the hardware will execute faster.  The more
  573. complicated the application and operating systems, and the larger their
  574. appetite for memory addresses, the higher the demand on hardware resources.
  575. CORSPEED plots the software demands [ using an address range model called the
  576. memory WINDOW ]against the operating curve of the core engine to determine
  577. effective speed.
  578.  
  579.  
  580. MEMORY WINDOWS
  581.  
  582. The aggregate addresses required by applications software is comprised of the
  583. addresses where the instructions [ operating code ] and data reside.  In
  584. general the larger and more complex the application the larger the spatial
  585. locality of code and data.  Software with very limited spatial locality has a
  586. smaller memory window than software with large, complex, memory and code
  587. structures.
  588.  
  589. Memory windows are deterministic in their impact on overall program running
  590. speed [ see Memory Configuration panel for explanation ].  For example, a
  591. program who's code and data fit entirely within the confines of an L2 cache
  592. can operate faster than one who's spatial memory requirements are 10, or 100
  593. times larger.  For a perfect PC, i.e. one with an infinite cache which never
  594. requires updating, all programs would run at the same speed [ the processor's
  595. clocking rate ].
  596.  
  597. Since cache system performance drops off sharply as memory demands increase,
  598. the memory window of each application directly impacts execution speed.
  599.  
  600.  
  601.  
  602.  
  603.  
  604.  
  605.  
  606.        CORSPEED DOCUMENTATION                                     Page 11
  607.  
  608.        Sofwin Laboratories                 SuperScalar Measurement Tools
  609.  
  610.  
  611. UNDERSTANDING EFFECTIVE DATA WIDTH
  612.  
  613. One of the most important qualities of memory system design is how well it
  614. accommodates data and instruction transfers between processor and memory.
  615. While the electrical path is a constant, i.e. 32 bits for 486 and Pentium PC
  616. systems, the effective working width of the memory system is sometimes
  617. constricted by cache management mechanics.  When the time required to access
  618. 32 bit data is about the same as it is for 16 bit data it means that the
  619. effective data width is a full 32 bits.  However, if it takes twice as long
  620. to access 32 bit data ( indicating that each 32 bit element has to be moved
  621. in two 16 bit tranches ) the effective data width is only 16 bits.
  622.  
  623. CORSPEED analyzes both read and write memory access times and computes the
  624. effective data width for each in bits.  The data width pictograms show the
  625. effective width of both the read and write channels.  Read/Write pictograms
  626. are colored RED when the width is 20 bits or less, YELLOW for 21 to 27 bits,
  627. CYAN 28 - 30, and GREEN whenever the width is 31 bits or wider.
  628.  
  629.  
  630. HIGH PERFORMANCE MEMORY SYSTEMS
  631.  
  632. CORSPEED can analyze core engine performance for both traditional dram based
  633. PC systems as well as the new high performance memory systems such as EDRAM.
  634. To compute core engine operating speeds for high performance memory systems,
  635. use the command line /e option.  While this option is intended to provide
  636. improved accuracy for high performance memory systems, it is also useful for
  637. estimating the relative impact high performance memory would have on ordinary
  638. dram based PC systems.
  639.  
  640. High Performance memory systems make it possible for main memory systems to
  641. perform as if they were one huge L2 cache.  The performance benefits of
  642. extremely fast read-write capabilities are only part of the story, since HPM
  643. also eliminates processor stoppages due to L2 cache management as well.
  644.  
  645. High performance memory gains its advantage by operating at nearly the same
  646. speed as the processor -- completely eliminating the overhead associated with
  647. L2 cache loading and unloading.  High Performance memory systems will be
  648. increasingly important as CPU data bandwidth demands continue to grow.
  649.  
  650.  
  651.  
  652.  
  653.  
  654.  
  655.  
  656.  
  657.  
  658.  
  659.  
  660.  
  661.        CORSPEED DOCUMENTATION                                     Page 12
  662.  
  663.        Sofwin Laboratories                 SuperScalar Measurement Tools
  664.  
  665.  
  666. HOW CORSPEED DIFFERS FROM BENCHMARKS
  667.  
  668. This Core Engine version of Sofwin Laboratories' new SuperScalar measurement
  669. technology is the most powerful tool of its kind ever developed.  CORSPEED
  670. extends 10 years of PC performance measurement tool development into
  671. multiprocessor families, multi-tasking, and 32 bit operating systems.
  672.  
  673. CORSPEED is a fully Pentium qualified, state-of-the-art SuperScalar
  674. measurement tool that reports how fast the core engine system of a PC runs in
  675. each of the four principal operating system environments.  CORSPEED is also a
  676. multiple task emulator and high performance memory estimator -- making
  677. CORSPEED, the most powerful, accurate, and useful performance assessment tool
  678. ever made available to the general public.
  679.  
  680. But that's only the technical side -- CORSPEED can even compute the cost per
  681. megahertz of achieved performance for wide range of situations ranging from a
  682. single task DOS application to multiple tasks running under true 32 bit
  683. environments such as OS/2 and Win32.  Here's a tool that Tells It Like It Is.
  684.  
  685.  
  686. HOW TO ESTIMATE HOW FAST MULTIPLE TASKS WILL RUN
  687.  
  688. One of the most useful aspects of CORSPEED is its ability to accurately
  689. project the effective running speed for one or several tasks or applications
  690. running concurrently.  To see how multiple tasks will impact your computer's
  691. performance use the /t xx option where xx is the total number of concurrently
  692. running tasks or applications.  CORSPEED defaults to 1 task, but it can
  693. project the impact of up to 16 applications running under OS/2 or Win32.
  694. While single foreground tasks are more typical of DOS and Win3 operations,
  695. CORSPEED projects the impact additional tasks would have in existing 16 bit
  696. operating system environments as well.
  697.  
  698. Many will be surprised to learn that when two tasks are operating, the
  699. combined operating speed of both is less than that of a single task.  The
  700. reason is that multiple tasks do more than share the processor time between
  701. them.  Cache churning, time slice administration, and out of sequence
  702. interrupt processing consume increasing amounts of raw computing power as
  703. more tasks are activated. Increased memory resources, especially if its high
  704. performance memory, is particularly important in multi-tasking situations.
  705.  
  706.  
  707.  
  708.  
  709.  
  710.  
  711.  
  712.  
  713.  
  714.  
  715.  
  716.        CORSPEED DOCUMENTATION                                     Page 13
  717.  
  718.        Sofwin Laboratories                 SuperScalar Measurement Tools
  719.  
  720.  
  721. CORE ENGINE PERFORMANCE IS NOT THE WHOLE STORY
  722.  
  723. Computer system performance is the result of many complex variables.  As
  724. important as processor type, clocking rate, cache facilities, and memory size
  725. may be, the two other principal computing theaters, video/graphics and mass
  726. storage [ disk ], are also critical to how fast programs will execute.  The
  727. reason is, that for the moment at least, the video channel is typically only
  728. 20% as fast as typical core engines, while the disk channel is very often
  729. less than 5% as fast.  Since video/graphics and disk access are increasingly
  730. critical to applications programs -- due to the popularity of graphics and
  731. DLL's -- very fast core engine systems can be dramatically slowed by poor
  732. performance outside of the core engine [ processor, cache, and memory ].
  733.  
  734. For example, as the memory resource demands of large applications, or
  735. multiple tasks increase, so does the probability and frequency of virtual
  736. memory swapping.  Sofwin Laboratories Professional Tools, such as PCPOWER,
  737. have built in Expert Systems that can analyze the performance of every
  738. hardware system -- making it possible to project how the target computer will
  739. perform under different loads and operating system environments.
  740.  
  741.  
  742. THE IMPORTANCE OF SUPERSCALAR TECHNOLOGY
  743.  
  744. 1994 marks the beginning of the SuperScalar revolution.  Beginning with the
  745. Intel Pentium, the SuperScalar age is upon us.  No longer will CPUs be
  746. limited to executing a single instruction at a time.  In the future, we'll
  747. have a choice between a wide range of SuperScalar processors from Digital
  748. Equipment, IBM-Apple-Motorola, MIPS, Cyrix and others.  The day of the
  749. simple, one-thing-at-a-time CPU is quickly fading.  SuperScalar technology,
  750. at first dual pipelined -- but soon perhaps offering many pipes -- is
  751. radically different -- requiring new ways of looking at and evaluating
  752. computing system performance.  CORSPEED is totally SuperScalar in its design
  753. and operation -- capable of instigating, managing and measuring many
  754. different operations at once.
  755.  
  756. This version, for example, not only supports all existing 486 processor
  757. designs, but a wide range of processors from Cyrix, AMD, IBM, and other x86
  758. compatible CPU families.  Sofwin's Professional tools are also fully
  759. SuperScalar -- so we'll be able to add new SuperScalar processor families
  760. such the ALPHA, MIPS and PowerPC processors in the months to come.
  761.  
  762.  
  763.  
  764.  
  765.  
  766.  
  767.  
  768.  
  769.  
  770.  
  771.        CORSPEED DOCUMENTATION                                     Page 14
  772.  
  773.        Sofwin Laboratories                 SuperScalar Measurement Tools
  774.  
  775.  
  776. SOFWIN FORUM MESSAGE SUPPORT
  777.  
  778. CORSPEED is designed to record performance information in a format suitable
  779. for CompuServe forum messages.  If you don't have a CompuServe account from
  780. which you can access the Sofwin Forum area, call CompuServe toll-free at (
  781. 800 ) 524-3388 to enroll.  Ask for Representative # 593 to sign up!
  782.  
  783. FILE NAMES
  784.  
  785. CORSPEED names forum records using the following system:
  786.  
  787.                CSP$mdd#.TXT,
  788.  
  789.                Where:        m = month ( from 0 -> C ),
  790.                             dd = day of month ( from 01 -> 31 )
  791.                              # = daily index code ( from 0 -> z ).
  792.  
  793. RECORDING
  794.  
  795. To record PC performance in a forum compatible format, press F3. This will
  796. generate a sequentially numbered record suitable for use with CIS interfacing
  797. software such as CompuServe's popular WinCim.  To capture the data OPEN the
  798. recording file, block the entire table and copy it to a forum or email
  799. message.
  800.  
  801.  
  802. USING THE SOFWIN COMMENTS EDITOR
  803.  
  804. The SOFWIN line editor permits the input editing or deleting of information
  805. using the keyboard and the mouse.  Cursor manipulation and keyboard input is
  806. handled in the customary DOS ways.
  807.  
  808. KEYBOARD
  809.  
  810.    Arrow Keys          Non destructive positioning of the edit cursor.
  811.  
  812.    HOME KEY            Moves cursor to first character on the line.
  813.  
  814.    END KEY             Moves cursor to the last character on the line.
  815.  
  816.    INS KEY             Toggles between INSERT and TYPEOVER input mode.
  817.  
  818.    ESCAPE KEY          Terminates edit and restores original contents.
  819.  
  820.    ENTER KEY           Terminates edit, prompts for approval if any changes.
  821.  
  822.    DEL KEY             Deletes the character at cursor position.
  823.  
  824.    BACKSPACE           Destructive cursor move over previous character.
  825.  
  826.        CORSPEED DOCUMENTATION                                     Page 15
  827.  
  828.        Sofwin Laboratories                 SuperScalar Measurement Tools
  829.  
  830.  
  831. PRINTER OUTPUT
  832.  
  833. There are several ways to cause the screen to be printed to the LPT1 device.
  834. From the keyboard either F7 or the PrtSc key may be pressed.  All screens may
  835. be printed as a group with the SHIFT F7 key.
  836.  
  837. If you have not used the printer during the current session, CORSPEED will
  838. ask you to verify that the printer is on-line and ready or work.  You may
  839. then select the character set supported by your printer.
  840.  
  841. For printers supporting the IBM PC character set select the PC8 option.
  842. Press the 'P' key to select PC8 character set output.  If your printer does
  843. not support the complete PC character set select the ASCII option.
  844.  
  845. Press the 'A' key to select the ASCII character set.  This will translate
  846. those characters above 127 to alternate characters for better looking
  847. results.
  848.  
  849. Press either the 'C' key or the ESC  key if the printer is not ready or you
  850. decide not to print the current screen.
  851.  
  852.  
  853.  
  854.  
  855.  
  856.  
  857.  
  858.  
  859.  
  860.  
  861.  
  862.  
  863.  
  864.  
  865.  
  866.  
  867.  
  868.  
  869.  
  870.  
  871.  
  872.  
  873.  
  874.  
  875.  
  876.  
  877.  
  878.  
  879.  
  880.  
  881.        CORSPEED DOCUMENTATION                                     Page16
  882.  
  883.        Sofwin Laboratories                 SuperScalar Measurement Tools
  884.  
  885.  
  886.          SECTION III -- HOW VERSION 6.1 DIFFERS FROM 6.0x releases
  887.  
  888.  
  889. This version of CORSPEED was developed specifically for the Sofwin Forum on
  890. CompuServe.  While it is operationally identical to previous versions,
  891. several new features and capabilities have been added.
  892.  
  893.  
  894. CHANGES TO EXISTING FEATURES
  895.  
  896. More than 100 changes have been made to correct operational problems or bugs.
  897. Some of the more obvious changes include:
  898.  
  899. The command line separator '=' has been eliminated.
  900.  
  901. The quick escape and termination facilities have been improved.
  902.  
  903. The processor clock multiple, ROM remap and memory width annunciators have
  904. been eliminated to reduce user confusion when used on differing processor
  905. families.
  906.  
  907. The image storage ( to file ) system has been updated to include date and
  908. time of screen image storage.
  909.  
  910. Display anomalies when run in black and white mode have been corrected.
  911.  
  912.  
  913. NEW FEATURES
  914.  
  915. EFFECTIVE READ-WRITE DATA WIDTH DISPLAY
  916.  
  917. This version of CORSPEED displays histograms which represent the effective
  918. reading and writing data width as seen from the processor's point of view.
  919. This information is derived from the average read and write to memory access
  920. times.
  921.  
  922.  
  923. UNDERSTANDING EFFECTIVE DATA WIDTH
  924.  
  925. One of the most important qualities of memory system design is how well it
  926. accommodates data and instruction transfers between processor and memory.
  927. While the electrical path remains constant, i.e. 32 bits for 486 and Pentium
  928. PC systems, the effective working width of the memory system can appear to be
  929. constricted by imbalance between processor and memory system bandwidth or
  930. cache management mechanics.  When the time required to access 32 bit data is
  931. about the same as it is for 16 bit data it means that the effective data
  932. width is a full 32 bits.  However, if it takes twice as long to access 32 bit
  933. data ( indicating that each 32 bit element has to be moved in two 16 bit
  934. tranches ) then the effective data width is only 16 bits.
  935.  
  936.        CORSPEED DOCUMENTATION                                     Page17
  937.  
  938.        Sofwin Laboratories                 SuperScalar Measurement Tools
  939.  
  940.  
  941. HISTOGRAM COLOR SCHEME
  942.  
  943. CORSPEED analyzes both read and write memory access times and computes the
  944. effective data width for each in bits.  The data width pictograms show the
  945. effective width of both the read and write channels.  Read/Write pictograms
  946. are colored RED when the width is 20 bits or less, YELLOW for 21 to 27 bits,
  947. CYAN 28 - 30, and GREEN whenever the width is 31 bits or wider.
  948.  
  949. SOFWIN FORUM MESSAGE SUPPORT
  950.  
  951. Sofwin Forum members found the screen image display generated by previous
  952. versions of CORSPEED to be difficult to capture and format within the
  953. confines of the CompuServe messaging and posting system.  To overcome this
  954. problem, this version of CORSPEED includes two entirely new functions, forum
  955. message generation and forum comment capture.  These features have been
  956. assigned the following function key assignments:
  957.  
  958. F3   Use this key to record performance information in a file format suitable
  959.      for importations into a CompuServe email or forum message structure.
  960.  
  961. F4   Use this key to define a comment line that describes the system being
  962.      evaluated.  This comment line is automatically included in all forum
  963.      recording files.
  964.  
  965. FORUM RECORDING PROCEDURES
  966.  
  967. CORSPEED is designed to record performance information in a format
  968. suitable for CompuServe forum messages.  If you don't have a CompuServe
  969. account from which you can access the Sofwin Forum area, call CompuServe
  970. toll-free at ( 800 ) 524-3388 to enroll.  Ask for Representative # 593 to
  971. sign up!
  972.  
  973. FILE NAMES:    Forum recording files are written to the default direction
  974.                from which CORSPEED was run.  Files are named in accordance
  975.                with the following system:
  976.  
  977.                CSP$mdd#.TXT,
  978.  
  979.                Where:    m    = month ( from 0 -> C ),
  980.                          dd   = day of month ( from 01 -> 31 )
  981.                          #    = daily index code ( from 0 -> z ).
  982.  
  983. RECORDING
  984.  
  985. To record PC performance in a forum compatible format, press F3.  This will
  986. generate a sequentially numbered record suitable for use with CIS interfacing
  987. software such as CompuServe's popular WinCim.  To capture the data OPEN the
  988. recording file, block the entire table and copy it to a forum or email
  989. message.
  990.  
  991. CORSPEED DOCUMENTATION                                     Page18
  992.  
  993.        Sofwin Laboratories                 SuperScalar Measurement Tools
  994.  
  995. COMMENT MANAGEMENT
  996.  
  997. It is particularly helpful, when several recordings are made or stored
  998. together, to be able to identify which recording goes with which equipment.
  999. To make certain that the operator is given an opportunity to enter comments
  1000. about each system, whenever the forum recording key ( F3 ) is pressed,
  1001. CORSPEED checks to see if any operator comments have been defined.  If
  1002. comments already exist they are automatically inserted in the recording file.
  1003. If no comments have been made by the operator, CORSPEED automatically opens
  1004. the comments input box and waits for the operator to make a note about the
  1005. system being recorded.  For information on using the comments line editor see
  1006. USING THE SOFWIN COMMENTS EDITOR section.
  1007.  
  1008. SAMPLE FORUM RECORDING
  1009.  
  1010.  |-----------------------------------------------------------|
  1011.  |                                                           |
  1012.  |                      THE SOFWIN FORUM                     |
  1013.  |                 CORSPEED PERFORMANCE RECORD               |
  1014.  |          Recorded Sunday May 29, 1994 @ 10:21:48          |
  1015.  |                                                           |
  1016.  |-----------------------------------------------------------|
  1017.  |                                                           |
  1018.  |  CPU FAMILY  |  CPU MODEL   | CLOCK SPEED  |   CPU MODE   |
  1019.  |  Intel+      |   486DX      |   33.01      |  VIRTUAL     |
  1020.  |                                                           |
  1021.  |L1 CACHE SIZE |L2 CACHE SIZE | MEMORY SIZE  |   ROM REMAP  |
  1022.  |      8       |     64       |    16.0      |    OK        |
  1023.  |                                                           |
  1024.  |  O/S  SYSTEM |  TASK COUNT  |EXTENSION BUS | CSP VERSION  |
  1025.  |MSDOS  6.2    |      1       |    ISA       |    6.1       |
  1026.  |                                                           |
  1027.  | - - - - - - DOS - - - - - - | - - - - Windows 3.x - - - - |
  1028.  |SPEED < MHz > |    CLOCK %   |SPEED < MHz > |    CLOCK %   |
  1029.  |    31.64     |    95.85     |    31.37     |    95.02     |
  1030.  |    28.90     |    87.56     |    24.80     |    75.12     |
  1031.  |    20.69     |    62.68     |    16.75     |    50.74     |
  1032.  |                                                           |
  1033.  | - - - - -  OS/2 - - - - - - | - - - - -  Win32  - - - - - |
  1034.  |SPEED < MHz > |    CLOCK %   |SPEED < MHz > |    CLOCK %   |
  1035.  |    27.67     |    83.83     |    19.60     |    59.36     |
  1036.  |    20.55     |    62.27     |    14.04     |    42.53     |
  1037.  |    15.39     |    46.63     |    14.04     |    42.53     |
  1038.  |                                                           |
  1039.  |  LOCAL BUS   | CPU REGISTER |CPU -> MEMORY | MEMORY -> CPU|
  1040.  |     32       |     32       |     32       |     22       |
  1041.  |                                                           |
  1042.  |-----------------------------------------------------------|
  1043.  |This is an AMI 486DX-33 system with 64 k of L2 cache       |
  1044.  |-----------------------------------------------------------|
  1045.  
  1046.        CORSPEED DOCUMENTATION                                     Page19
  1047.  
  1048.        Sofwin Laboratories                 SuperScalar Measurement Tools
  1049.  
  1050.  
  1051. HOW TO COPY CORSPEED RECORDING TO A FORUM MESSAGE
  1052.  
  1053. USING COMPUSERVE'S WINCIM:
  1054.  
  1055. Select FILE then OPEN from the WinCim control panel to invoke the text
  1056. editor.  Select the drive and directory where CORSPEED resides.  All files
  1057. with the .TXT extension will appear in the file selector box.  CORSPEED forum
  1058. recordings can be easily identified from their naming format:
  1059.  
  1060.      CSP$xxxx.txt
  1061.  
  1062. Select the desired forum recording file to load it into the text editor.
  1063. Pull down the EDIT menu and click on the SELECT ALL option to mark the forum
  1064. recording text.  Click on COPY then close the Notepad editor and return to
  1065. WinCim.
  1066.  
  1067. Create a forum message in the normal way and when you reach the point where
  1068. you want to insert the CORSPEED forum recording text, select EDIT and click
  1069. on COPY.  This will insert the CORSPEED data into your forum message.
  1070.  
  1071.  
  1072. USING A FORUM NAVIGATOR
  1073.  
  1074. Given the proliferation of CIS Auto Navigator programs, it is not possible to
  1075. define a specific procedure for importing the CORSPEED data recording into a
  1076. forum message.  In general, block move and file read operations typical of
  1077. most editors can be used to transfer the text.
  1078.  
  1079. It should be noted, however, that the space which occupies column 1 of the
  1080. forum recording file is there for a purpose and should be included when
  1081. placing this text in a forum message.  Without the space at the beginning of
  1082. each line of the recording, unless the "Unformatted" method selected, CIS
  1083. will attempt to reformat the message causing it to be unreadable.
  1084.  
  1085.  
  1086.  
  1087.  
  1088.  
  1089.  
  1090.  
  1091.  
  1092.  
  1093.  
  1094.  
  1095.  
  1096.  
  1097.  
  1098.  
  1099.  
  1100.  
  1101.        CORSPEED DOCUMENTATION                                     Page20
  1102.  
  1103.        Sofwin Laboratories                 SuperScalar Measurement Tools
  1104.  
  1105.  
  1106.                     SECTION IV -- OPERATING PRINCIPLES
  1107.  
  1108.  
  1109. MEMORY CONFIGURATION
  1110.  
  1111. The memory cache levels used in 486 based PCs are numbered L1 and L2,
  1112. according to their proximity to the processor.  The on-chip cache is called
  1113. L1, while a secondary cache [ logically residing between the processor and
  1114. main memory ] is called L2.  CORSPEED measures and reports on the
  1115. organization of each cache level.  Cache size is displayed in kilobytes.
  1116. Cache size, speed, and organization are instrumental in determining program
  1117. operating speeds.  In general, memory caching systems provide the biggest
  1118. benefit when program code and data are frequently accessed from the cache.
  1119. That's because the CPU must wait when- ever new data is uploaded from main
  1120. memory -- thereby yielding some of its speed advantage.  In general, the more
  1121. the software's memory address span exceeds cache size, the less effective the
  1122. cache.  For complex, multi-tasking operating systems, or very large memory
  1123. spans, cache miss penalties can effectively cancel some or all of the
  1124. benefits of cache memory.
  1125.  
  1126.  
  1127. SYSTEM INFORMATION
  1128.  
  1129. Accurate performance measurement requires that there be nothing else going on
  1130. that might interfere with the measurement routines in CORSPEED.  CORSPEED
  1131. derives its information by directly manipulating all of the core-engine
  1132. hardware systems.  To do its job, CORSPEED must be operated at the equivalent
  1133. of Intel's PL-0.  While operating at the O/S kernel level, and actively
  1134. interleaving with and preempting DOS interrupts, it is possible for
  1135. measurement primitives to accurately measure hardware operations at the
  1136. electrical event level.  FOR BEST RESULTS USE THIS TOOL ONLY ON DOS BASED
  1137. PCs.
  1138.  
  1139. CORSPEED is certified to operate with standard MSDOS, versions 3.1 and up.
  1140. Measurement activity will be adversely impacted in any operating environment
  1141. that preempts PL-0, loads CORSPEED at an unpredictable address, or interferes
  1142. with interrupt management.  This means that CORSPEED will not provide
  1143. satisfactory results under other operating systems including Windows [ any
  1144. version ], or OS/2.
  1145.  
  1146.  
  1147.  
  1148.  
  1149.  
  1150.  
  1151.  
  1152.  
  1153.  
  1154.  
  1155.  
  1156.        CORSPEED DOCUMENTATION                                    Page 21
  1157.  
  1158.        Sofwin Laboratories                 SuperScalar Measurement Tools
  1159.  
  1160.  
  1161. HIGH PERFORMANCE MEMORY SYSTEMS
  1162.  
  1163. CORSPEED can analyze core engine performance for both traditional dram based
  1164. PC systems as well as simulate the new high performance memory systems such
  1165. as EDRAM. To simulate core engine operating speeds for high performance
  1166. memory systems, use the command line /e option.   High Performance memory
  1167. systems make it possible for main memory systems to perform as if they were
  1168. one huge L2 cache.  The performance benefits of extremely fast read-write
  1169. capabilities are only part of the story, since HPM also eliminates processor
  1170. stoppages due to L2 cache management as well.  High performance memory gains
  1171. its advantage by operating at nearly the same speed as the processor --
  1172. completely eliminating the overhead associated with L2 cache loading and
  1173. unloading.  High Performance memory systems will be increasingly important as
  1174. CPU data bandwidth demands continue to grow.
  1175.  
  1176.      NOTE:  NOT ALL PC SYSTEM DESIGNS ARE EQUAL -- INCLUDING HIGH
  1177.      PERFORMANCE DESIGNS.  CORSPEED's simulation is no guarantee that any
  1178.      PC system fully implements all of the performance benefits of EDRAM
  1179.      or other memory systems.
  1180.  
  1181.  
  1182. HOW TO ESTIMATE HOW FAST MULTIPLE TASKS WILL RUN
  1183.  
  1184. One of the most useful aspects of CORSPEED is its ability to accurately
  1185. project the effective running speed for one or several tasks or applications
  1186. running concurrently.  To see how multiple tasks will impact your computer's
  1187. performance use the /t=xx option where xx is the total number of concurrently
  1188. running tasks or applications.  CORSPEED defaults to 1 task, but it can
  1189. project the impact of up to 16 applications running under OS/2 or Win32.
  1190. While single foreground tasks are more typical of DOS and Win3 operations,
  1191. CORSPEED projects the impact additional tasks would have in existing 16 bit
  1192. operating system environments as well.  Many will be surprised to learn that
  1193. when two tasks are operating, the combined operating speed of both is less
  1194. than that of a single task.  The reason is that multiple tasks do more than
  1195. share the processor time between , them.  Cache churning, time slice
  1196. administration, and out of sequence interrupt processing consume increasing
  1197. amounts of raw computing power as more tasks are activated. Increased memory
  1198. resources, especially if it's high performance memory, is particularly
  1199. important in multi-tasking situations.
  1200.  
  1201.  
  1202.  
  1203.  
  1204.  
  1205.  
  1206.  
  1207.  
  1208.  
  1209.  
  1210.  
  1211.        CORSPEED DOCUMENTATION                                    Page 22
  1212.  
  1213.        Sofwin Laboratories                 SuperScalar Measurement Tools
  1214.  
  1215.  
  1216. CORE ENGINE PERFORMANCE IS NOT THE WHOLE STORY
  1217.  
  1218. Computer system performance is the result of many complex variables.  As
  1219. important as processor type, clocking rate, cache facilities, and memory size
  1220. may be, the two other principal computing theaters, video/graphics and mass
  1221. storage [ disk ], are also critical to how fast programs will execute.  The
  1222. reason is, that for the moment at least, the video channel is typically only
  1223. 20% as fast as typical core engines, while the disk channel is very often
  1224. less than 5% as fast.  Since video/graphics and disk access are increasingly
  1225. critical to applications programs -- due to the popularity of graphics and
  1226. DLL's -- very fast core engine systems can be dramatically slowed by poor
  1227. performance outside of the core engine [ processor, cache, and memory ].  For
  1228. example, as the memory resource demands of large applications, or multiple
  1229. tasks increase, so does the probability and frequency of virtual memory
  1230. swapping.  Sofwin Laboratories Professional Tools, such as PCPOWER, have
  1231. built in Expert Systems that can analyze the performance of every hardware
  1232. system -- making it possible to project how the target computer will perform
  1233. under different loads and operating system environments.
  1234.  
  1235.  
  1236. THE IMPORTANCE OF SUPERSCALAR TECHNOLOGY
  1237.  
  1238. 1994 marks the beginning of the SuperScalar revolution.  Beginning with the
  1239. Intel Pentium, the SuperScalar age is upon us.  No longer will CPUs be
  1240. limited to executing a single instruction at a time.  In the future, we'll
  1241. have a choice between a wide range of SuperScalar processors from Digital
  1242. Equipment, IBM-Apple-Motorola, MIPS, Cyrix and others.  The day of the
  1243. simple, one-thing-at-a-time CPU is quickly fading.  SuperScalar technology,
  1244. at first dual pipelined -- but soon perhaps offering many pipes -- is
  1245. radically different -- requiring new ways of looking at and evaluating
  1246. computing system performance.  CORSPEED is totally SuperScalar in its design
  1247. and operation -- capable of instigating, managing and measuring many
  1248. different operations at once.  This version, for example, not only supports
  1249. all existing 486 processor de- signs, but a wide range of processors from
  1250. Cyrix, AMD, IBM, and other x86 compatible CPU families.  Sofwin's
  1251. Professional tools are also fully SuperScalar -- so we'll be able to add new
  1252. SuperScalar processor families such the ALPHA, MIPS and PowerPC processors in
  1253. the months to come.
  1254.  
  1255.  
  1256.  
  1257.  
  1258.  
  1259.  
  1260.  
  1261.  
  1262.  
  1263.  
  1264.  
  1265.  
  1266.        CORSPEED DOCUMENTATION                                    Page 23
  1267.  
  1268.        Sofwin Laboratories                 SuperScalar Measurement Tools
  1269.  
  1270.  
  1271. PROCESSOR FAMILIES
  1272.  
  1273. Until recently, Intel was the only processor family found on PC systems.  But
  1274. now there are several others including Cyrix, PowerPC, AMD, Digital, IBM,
  1275. MIPS etc.  Sofwin's SST technology recognizes both processor type and family.
  1276. For some processors, such as clones of the Intel 486 made by AMD, or IBM,
  1277. there is no way to accurately determine who made the CPU since they are all
  1278. made from the same identical design.  We call this processor family the
  1279. INTEL+ family since the processor may have been made by Intel or one of its
  1280. licensees.  Parts which can be positively identified, including Pentium, and
  1281. Cyrix CPUs are reported as belonging to the Cyrix or Intel families and their
  1282. respective model designations.  Where available, Sofwin tools also detect
  1283. hidden model, stepping and feature information as well.
  1284.  
  1285. Since processor model identification and family are essential to accurate
  1286. performance measurement, CORSPEED will generate an error message and return
  1287. to the DOS command line whenever an unknown processor model or family is
  1288. detected.  REGISTERED users of CORSPEED will be notified when new versions of
  1289. CORSPEED are released which support additional CPU models.
  1290.  
  1291.  
  1292.  
  1293.  
  1294.  
  1295.  
  1296.  
  1297.  
  1298.  
  1299.  
  1300.  
  1301.  
  1302.  
  1303.  
  1304.  
  1305.  
  1306.  
  1307.  
  1308.  
  1309.  
  1310.  
  1311.  
  1312.  
  1313.  
  1314.  
  1315.  
  1316.  
  1317.  
  1318.  
  1319.  
  1320.  
  1321.        CORSPEED DOCUMENTATION                                    Page 24
  1322.  
  1323.        Sofwin Laboratories                 SuperScalar Measurement Tools
  1324.  
  1325.  
  1326.                  SECTION V -- ABOUT SOFWIN LABORATORIES
  1327.  
  1328.  
  1329. Sofwin Laboratories is an independent computer performance measurement and
  1330. consulting laboratory with facilities in the San Francisco Bay Area and an
  1331. Engineering Development facility in Columbus, Ohio.  Sofwin's primary mission
  1332. is helping its consulting clients and technology licensees get the most
  1333. performance for their money.  The laboratories also work with PC system
  1334. designers and builders in planing and designing high performance computing
  1335. systems and peripherals.  The Sofwin measurement tools are designed and
  1336. developed specifically for use in our own laboratories as well as by
  1337. professionals responsible for the selection and maintenance of PC systems in
  1338. business and governmental agencies world-wide.  Sofwin Laboratories also
  1339. sponsors a computer measurement Forum on CompuServe as well as Sofwin Reports
  1340. -- the Journal of Computing Performance and Productivity.  For more
  1341. information on Sofwin Laboratory services, call our Columbus Engineering
  1342. Center at (614) 866-9966.
  1343.  
  1344.  
  1345. WANT TO KNOW MORE?
  1346.  
  1347. SOFWIN REPORTS
  1348.  
  1349. If you're interested in knowing more about PC system performance, you'll find
  1350. Sofwin Reports, the official publication of Sofwin Laboratories, an excellent
  1351. source of information on PC measurement systems, fleet operation, and
  1352. professional performance reviews.  Every fact-filled issue of this
  1353. publication is geared to understanding the issues and the choices confronting
  1354. everyone who has to make product choices.  Sofwin Reports subscriptions are
  1355. only $99 per year in the United States, or $129 elsewhere -- including Air
  1356. Mail delivery.  To subscribe, send a check of money order, payable to Sofwin
  1357. Publishing Company, 613 Old Farm Road, Columbus, Ohio 43213.  U. S. companies
  1358. and governmental agencies may fax their purchase order to (614) 866-9960 for
  1359. standard 30 day billing.
  1360.  
  1361.  
  1362. FREE PROFESSIONAL MEASUREMENT TOOL CATALOG
  1363.  
  1364. If you would like to have a copy of Sofwin Laboratories current measurement
  1365. tool catalog either mailed or faxed to your office call our Columbus
  1366. Engineering facility at (800) 339-2579.
  1367.  
  1368.  
  1369.  
  1370.  
  1371.  
  1372.  
  1373.  
  1374.  
  1375.  
  1376.        CORSPEED DOCUMENTATION                                    Page 25
  1377.  
  1378.        Sofwin Laboratories                 SuperScalar Measurement Tools
  1379.  
  1380.  
  1381.                    SECTION VI -- SHAREWARE REGISTRATION
  1382.  
  1383. While CORSPEED is being offered as shareware, it is neither free nor a toy.
  1384. This is the same fully functional, professional grade measurement tool
  1385. included in our full professional tool kit [ ProPakSix ].
  1386.  
  1387. You may acquire a fully licensed copy of this software directly from Sofwin
  1388. Laboratories for only $39.  Registrants receive a serial numbered copy of
  1389. CORSPEED on a 3.5 inch diskette and three free sample issues of Sofwin
  1390. Reports.  Send your  check in the amount of $39 to CORSPEED Registration,
  1391. Sofwin Laboratories,  613 Old Farm Road, Columbus, Ohio 43213, or call (800)
  1392. 339-2579 to use your credit card.
  1393.  
  1394.  
  1395.  
  1396. Sofwin Laboratories
  1397. 613 Old Farm Road
  1398. Columbus, Ohio 43213
  1399.  
  1400. Telephone:  (614) 866-9966
  1401. BBS/FAX  (614) 866-9960
  1402. CompuServe 74431,1071
  1403.  
  1404.  
  1405.  
  1406.  
  1407.  
  1408.  
  1409.  
  1410.  
  1411.  
  1412.  
  1413.  
  1414.  
  1415.  
  1416.  
  1417.  
  1418.  
  1419.  
  1420.  
  1421.  
  1422.  
  1423.  
  1424.  
  1425.  
  1426.  
  1427.  
  1428.  
  1429.  
  1430.  
  1431.        CORSPEED DOCUMENTATION                                    Page 26
  1432.  
  1433.        Sofwin Laboratories                 SuperScalar Measurement Tools
  1434.  
  1435.  
  1436.